iT邦幫忙

2023 iThome 鐵人賽

DAY 1
0
AI & Data

30天內成為NLP大師:掌握關鍵工具和技巧系列 第 1

【Day 1】學習NLP前我們應該要準備什麼?

  • 分享至 

  • xImage
  •  

前言

在去年的這個時候,我參加了2022年的iThome鐵人賽,起初的原因是想要找一個平台來儲存個人筆記並與他人分享。雖然在比賽中我取得了佳作的成績,但我認為那時的我只是個小菜鳥,沒有辦法很好得傳遞我的想法。

經過一年的訓練,我現在已經準備出版人生中的第一本書了。因此今年我打算在30天內將我在這一年中所學到的所有知識和工具都濃縮在一起,而這個主題就是自然語言處理(Natural Language Processing, NLP)

自然語言處理的應用

人工智慧的熱潮近年來不斷上升,而ChatGPT則是其中最受討論和關注的議題之一,其優秀的語言生成和對話能力使其能夠進行各種形式的自然語言交互,因此在多個領域都有廣泛的應用。不過大部分的人的認知僅限於此而已,而我在這30天的目的就是要讓你們從頭學習這些NLP的技術,並且通過1~3天一個專案的方式,來逐步帶領你如何撰寫有關於這些人工智慧的程式碼。

這30天內你會學到什麼?

  • 電腦如何通過Embedding讀懂文字
  • Pandas處理資料的方式
  • Pytorch程式碼與對應的理論
  • TorchText的使用時機與案例
  • DNNRNNLSTM用於自然語言處理
  • Transformer的強大之處與實作
  • BERTT5GPT等應用與實作
  • GPT家族介紹與ChatGPT的正確使用方式

在接下來的30天,我將詳細地教導你這些熱門語言模型的原理與概念,並在每個專案中逐步向你介紹分析這些語言模型的方法,例如:Attention可視化Embedding可視化文字關聯性分析...等技術。

這樣做的目的是讓你逐漸理解在自然語言處理中常用的技術在實際應用方面的用途,並藉此在未來的發展中更好地應用這些技術。

在這30天的學習過程中,你不僅僅只會學到理論知識,還會通過撰寫程式碼的實作方式,來讓你打造最紮實的基礎。

需要準備哪些工具?

  • Python 3.7.8
  • 顯示卡(NVDIA 950以上)
  • Windows作業系統
  • 一個認真學習的心

在這次的內容中不會從Python基礎語法開始學習,而是從人工智慧的理論開始。而這些NLP分析工具或函式庫,我將在後續的幾天中逐步教你安裝並指導如何查看它們的官方文件,以確保你能夠按照本文進行學習,而不受這些網站更新的影響。

後話

如果你對其他領域有興趣,或者是一個對程式沒有基礎的人,你可以到我的GitHub上觀看我今年出版的書籍所包含的程式碼,這些程式碼可以幫助你理解這些領域的概念!

當然如果有問題也歡迎詢問,畢竟在學習的路上需要互相幫助才能共同進步。那麼我們明天再見!


下一篇
【Day 2】電腦該怎麼理解人類的語言 (上) - 文字怎麼輸入到模型中
系列文
30天內成為NLP大師:掌握關鍵工具和技巧30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言